重要

由于之前代码的不严谨,导致结果和结论的错误,深表歉意,现在对其进行修正

摘要

事务在日常开发中是不可避免碰到的问题,JDBC中的事务隔离级别到底会如何影响事务的并发,脏读(dirty reads), 不可重复读(non-repeatable reads),幻读(phantom reads)到底是什么概念

事务

  1. 原子性(atomicity) 事务是数据库的逻辑工作单位,而且是必须是原子工作单位,对于其数据修改,要么全部执行,要么全部不执行。

  2. 一致性(consistency) 事务在完成时,必须是所有的数据都保持一致状态。在相关数据库中,所有规则都必须应用于事务的修改,以保持所有数据的完整性。

  3. 隔离性(isolation) 一个事务的执行不能被其他事务所影响。

  4. 持久性(durability) 一个事务一旦提交,事物的操作便永久性的保存在数据库中,即使此时再执行回滚操作也不能撤消所做的更改。

隔离性

以上是数据库事务-ACID原则,在JDBC的事务编程中已经为了我们解决了原子性,持久性的问题,唯一可配置的选项是事务隔离级别,根据com.mysql.jdbc.Connection的定义有5个级别:

  1. TRANSACTION_NONE(不支持事务)

  2. TRANSACTION_READ_UNCOMMITTED

  3. TRANSACTION_READ_COMMITTED

  4. TRANSACTION_REPEATABLE_READ

  5. TRANSACTION_SERIALIZABLE

读不提交(TRANSACTION_READ_UNCOMMITTED)

不能避免dirty reads,non-repeatable reads,phantom reads

读提交(TRANSACTION_READ_COMMITTED)

可以避免dirty reads,但是不能避免non-repeatable reads,phantom reads

重复读(TRANSACTION_REPEATABLE_READ)

可以避免dirty reads,non-repeatable reads,但不能避免phantom reads

序列化(TRANSACTION_SERIALIZABLE)

可以避免dirty reads,non-repeatable reads,phantom reads

创建一个简单的表来测试一下隔离性对事务的影响

CREATE TABLE `account` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `user_id` int(11) DEFAULT NULL,
  `balance` int(11) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=2 DEFAULT CHARSET=utf8;

脏读(dirty reads)

事务A修改了一个数据,但未提交,事务B读到了事务A未提交的更新结果,如果事务A提交失败,事务B读到的就是脏数据。

TEST:
事务A: update account += 1000, 然后回滚
事务B: 尝试读取 account 的值
期望结果:
当设置隔离级别为TRANSACTION_READ_UNCOMMITTED时,事务B读取到的值不一致
当设置隔离级别大于TRANSACTION_READ_UNCOMMITTED时,事务B读取到的值一致

先创建一个read任务

class ReadTask implements Runnable {
    int level = 0;
    
    public ReadTask(int level) {
        super();
        this.level = level;
    }

    @Override
    public void run() {
        Db.tx(level, new IAtom() {
            @Override
            public boolean run() throws SQLException {
                AccountService service = new AccountService();
                System.out.println(Thread.currentThread().getId() + ":" + service.audit());
                return true;
            }
        });
    }
}

其中AccountService代码(提供了读和写balance的方法)

public class AccountService {
    
    // 貌似这个方法有执行了行锁
    public void deposit(int num) throws Exception {
        int index = Db.update("update account set balance = balance + " + num + " where user_id = 1");
        if(index != 1)
            throw new Exception("Oop! deposit fail.");
    }
    
    public int audit() {
        return Db.findFirst("select balance from account where user_id = 1").getInt("balance");
    }
}

PS: 上述代码所使用的框架为JFinal(非常优秀的国产开源框架)

对于Db.findFirst和Db.update这2个方法就是对JDBC操作的一个简单的封装

然后再创建一个writer任务

class WriterTask implements Runnable {
    int level = 0;
    
    public WriterTask(int level) {
        super();
        this.level = level;
    }
    
    @Override
    public void run() {
        Db.tx(level, new IAtom() {
            @Override
            public boolean run() throws SQLException {
                AccountService service = new AccountService();
                try {
                    service.deposit(1000);
                    System.out.println("Writer 1000.");
                    Thread.sleep(1000);
                    System.out.println("Writer complete.");
                } catch (Exception e) {
                    e.printStackTrace();
                }
                return false;
            }
        });
    }
}

然后执行主线程

public static void main(String[] args) throws Exception {
    int level = Connection.TRANSACTION_READ_UNCOMMITTED;
    for(int j = 0; j < 10; j++) {
        if(j == 3) new Thread(new WriterTask(level)).start();
        try {
            Thread.sleep(300);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
        new Thread(new ReadTask(level)).start();
    }    
}

上诉代码开启ReadTask和WriterTask对balance的值进行并发的写入和读取,并且WriterTask最终会回滚事务

当隔离级别为TRANSACTION_READ_UNCOMMITTED时,发现在WriterTask-commit事务前后读取到的值不一样

13:0
14:0
15:0
Writer 1000.
17:1000
18:1000
19:1000
Writer complete.
20:0
21:0
22:0
23:0

然后修改代码的隔离级别为TRANSACTION_READ_COMMITTED,发现前后读取的值一致,但是值得注意的是的,数据一致是建立在WriterTask事务回滚的情况下,如果事务正确的提交了,还是有出现数据不一致的问题,关于数据的一致性就不能简单的使用事务隔离来解决了,需要lock,关于数据一致的问题不在本文章讨论内

13:0
14:0
15:0
Writer 1000.
17:0
18:0
19:0
Writer complete.
20:0
21:0
22:0
23:0

不可重复读(non-repeatable reads)

在同一个事务中,对于同一份数据读取到的结果不一致。比如,事务B在事务A提交前读到的结果,和提交后读到的结果可能不同。

TEST:
事务A: update account += 1000, 然后commit
事务B: 尝试读取 account 的值(间隔2秒),再次尝试读取

为了满足不可重复读的测试对ReadTask作一些小改动

class ReadTask2 implements Runnable {
    int level = 0;
    
    public ReadTask2(int level) {
        super();
        this.level = level;
    }

    @Override
    public void run() {
        Db.tx(level, new IAtom() {
            @Override
            public boolean run() throws SQLException {
                AccountService service = new AccountService();
                System.out.println(Thread.currentThread().getId() + ":" + service.audit());
                try {
                    Thread.sleep(2000);
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }
                System.out.println(Thread.currentThread().getId() + ":" + service.audit());
                return true;
            }
        });
    }
}

在代码中间隔2s,然后重复访问同一个balance字段

主线程代码

public static void main(String[] args) throws Exception {
    int level = Connection.TRANSACTION_REPEATABLE_READ;
    new Thread(new ReadTask2(level)).start();
    Thread.sleep(1500);
    new Thread(new WriterTask2(level)).start();
    Thread.sleep(1500);
}

设置隔离界别为TRANSACTION_READ_UNCOMMITTED

10:17000
Writer 1000.
10:18000

设置隔离界别为TRANSACTION_REPEATABLE_READ

10:18000
Writer 1000.
10:18000

读取到的1800是WriterTask事务未提交之前的值,假如要实时的获取balance的最新值,WriterTask很显然还是需要加lock,所以无可重复读的隔离级别只是避免了在同一个事务中数据读取的一致性,而不保证最终的数据一致性

幻读(phantom reads)

在同一个事务中,同一个查询多次返回的结果不一致。

ReadTask和WriterTask分别进行insert的sql与select的操作(select count(*) from account)

TEST:
事务A: insert account 然后commit
事务B: 尝试读取 account 的数量(间隔2秒),再次尝试读取

设置隔离界别为TRANSACTION_READ_COMMITTED

12:0
create account.
12:1

设置隔离界别为TRANSACTION_REPEATABLE_READ

12:1
create account.
12:1

设置隔离界别为TRANSACTION_SERIALIZABLE

12:2
create account.
12:2

关于最高级别序列化是只有当一个事务完成后才会执行下一个事务,但是这里我测试使用TRANSACTION_REPEATABLE_READ级别是还是避免了幻读,不知道是程序的问题还是JDBC的问题,这里我可能还需要进一步的测试和研究,但是根据官方对TRANSACTION_REPEATABLE_READ的说明

A constant indicating that dirty reads, non-repeatable reads and phantom reads are prevented. This level includes the prohibitions in TRANSACTION_REPEATABLE_READ and further prohibits the situation where one transaction reads all rows that satisfy a WHERE condition, a second transaction inserts a row that satisfies that WHERE condition, and the first transaction rereads for the same condition, retrieving the additional "phantom" row in the second read.

表示幻读的定义是在同一个事务中,读取2次的值是不一样的,因为有其他事务添加了一行,并且这行数据是满足第一个事务的where查询条件的数据

总结

本次测试使用JFinal框架(它对JDBC进行了很简易的封装),使用不同的隔离级别对3种并发情况进行测试,但是在幻读的测试中TRANSACTION_REPEATABLE_READ级别同样也避免了幻读的情况,这个有待进一步测试和研究

补充说明

  1. 同一个事务: 在JDBC编程中同一个事务意味着拥有相同的Connection,也就是说如果想保证事务的原子性所有的执行必须使用同一个Connection,事务的代表就是Connection

  2. commit和rollback:在JDBC编程中一旦代码commit成功就无法rollback,所以一般rollback是发生在commit出现异常的情况下


风花狂月
132 声望7 粉丝

just a hack